Si vous souhaitez télécharger notre script, il est disponible juste ICI!

Sinon pour voir ce que ça donne, il vous suffit de regarder ce qui suit!

#!/bin/bash
# 1. LECTURE DES PARAMETRES : le fichier INPUT contient 2 lignes : DOSSIERURL, OUTPUT
#lancer le script
#bash cinqueme_script.sh < parametre.txt
read repertoire_fichier_URL;
read NOMDEFICHIER_COMPLEX;
read motif;
# 2. PREPARATION DU FICHIER DE SORTIE
echo "<!DOCTYPE html>" > $NOMDEFICHIER_COMPLEX;
echo "<html>" >> $NOMDEFICHIER_COMPLEX;
echo "<head>" >> $NOMDEFICHIER_COMPLEX;
echo "<title>" >> $NOMDEFICHIER_COMPLEX;
echo "</title>" >> $NOMDEFICHIER_COMPLEX;
echo "<meta charset='UTF-8' />" >> $NOMDEFICHIER_COMPLEX;
echo "<link href='bootstrap/css/bootstrap.css' rel='stylesheet' media='screen'>" >> $NOMDEFICHIER_COMPLEX;
echo "</head>" >> $NOMDEFICHIER_COMPLEX;
echo "<body>" >> $NOMDEFICHIER_COMPLEX;
let "compteurdelangue = 0"; 
rm ../FICHIERGLOBAUX/*;
# TRAITEMENT DE CHACUN DES SCRIPT DES FICHIERS D'URLS
for FICHIER_URL in `ls $repertoire_fichier_URL`
do
  let "jesuiscompteur = 1";
  nbdump=0;
  echo "<div id='table_url' class='table table-hover' style='width:1200px;margin:auto;font-size:0.8em;text-align:center'>" >> $NOMDEFICHIER_COMPLEX;
  echo "<h1>FICHIER URL : $repertoire_fichier_URL/$FICHIER_URL</h1>
      <table class='table'>
      <thead class='head_table'>
        <tr>
          <th>N°</th>
          <th class='url'>URL</th>
          <th>Pages<br/>Aspirées</th>
          <th>Retour<br/>CURL</th>
          <th>Encodage</th>
          <th>Dump<br/>(encodage)</th>
          <th>Dump<br/>(utf8)</th>
          <th>Contexte<br/>(utf8)</th>
          <th>Contexte<br/>(HTML)</th>
          <th>Fq Motif<br/>dans DUMP</th>
          <th>Index<br/>Dump</th>
        </tr>
      </thead>
    <tbody>" >> $NOMDEFICHIER_COMPLEX;
  let "compteurdelangue = compteurdelangue+1";
  # TRAITEMENT DE CHAQUE LIGNE DU FICHIER URL COURANT DANS LA BOUCLE FOR
  for element in `cat $repertoire_fichier_URL/$FICHIER_URL`
    do 
    #on travaille sur element
    curl -o ../PAGES-ASPIREES/$compteurdelangue-$jesuiscompteur.html "$element";
    retourcurl=$?;
    contenupageaspiree=$(egrep -i -o "(400 )?Bad request|Moved Permanently|Not Acceptable|Access Denied|Object Moved|The document has moved"../PAGES-ASPIREES/$compteurdelangue-$jesuiscompteur.html | sort -u);
    if [[ $contenupageaspiree != "" ]]
    then
      retourcurl="<span>$retourcurl</span><br/><small>Error : $contenupageaspiree</small>";
    fi
    echo "Retour curl : $retourcurl";
    if [[ $retourcurl==0 ]]
      then
        encodage=$(detect-encoding/detect-encodage ../PAGES-ASPIREES/$compteurdelangue-$jesuiscompteur.html | tr "a-z" "A-Z" | sed "s/\n//");
        echo "ENCODAGE de la page : <$encodage> ";
        if [[ $encodage == "UTF-8" ]]
          then
          echo "LA PAGE ASPIREE EST EN UTF8, ON VA POUVOIR RECUPERER LE DUMP DIRECTEMENT ET INSERER UNE LIGNE DANS LE TABLEAU";
          lynx -dump -nolist -assume_charset="$encodage" -display_charset="$encodage" $element  > ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt ;
          if [[ ($FICHIER_URL == "anglais.txt") || ($FICHIER_URL == "francais.txt") || ($FICHIER_URL == "wolof.txt") ]] #si c'est du français, anglais et wolof
            then
              egrep -i "\b$motif\b" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt > ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt ;
              perl minigrep/minigrepmultilingue.pl "utf-8" ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt parametre-motif.txt;
              mv resultat-extraction.html ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.html ;
              comptagemotif=$(egrep -ico "$motif" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt);
              egrep -o "\w+" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt | sort | uniq -c | sort -r > ../DUMP-TEXT/index-$compteurdelangue-$jesuiscompteur.txt ;
              echo "<tr>
                  <th>$jesuiscompteur</th>
                  <th class='url'><a href='$element' target='_blank'>$element</a></th>
                  <th><a href='../PAGES-ASPIREES/$compteurdelangue-$jesuiscompteur.html' target='_blank'>$jesuiscompteur</a></th>
                  <th>$retourcurl</th>
                  <th>$encodage<br/>(detect-encodage)</th>
                  <th>-</th>
                  <th><a href='../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt' target='_blank'>dump-$jesuiscompteur</a></th>
                  <th><a href='../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt' target='_blank'>contexte-$jesuiscompteur</a></th>
                  <th><a href='../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.html' target='_blank'>contexte-$jesuiscompteur</a></th>
                  <th>$comptagemotif</th>
                  <th><a href='../DUMP-TEXT/index-$compteurdelangue-$jesuiscompteur.txt' target='_blank'>index-$jesuiscompteur</a></th>
                </tr>" >> $NOMDEFICHIER_COMPLEX
              echo "<file=$nbdump>" >> ../FICHIERGLOBAUX/CONTEXTES-GLOBAUX_$compteurdelangue.txt;
              echo "<file=$nbdump " >> ../FICHIERGLOBAUX/DUMP-GLOBAUX_$compteurdelangue.txt;
              cat ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt >> ../FICHIERGLOBAUX/CONTEXTES-GLOBAUX_$compteurdelangue.txt;
              cat ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt >> ../FICHIERGLOBAUX/DUMP-GLOBAUX_$compteurdelangue.txt;
              let "nbdump+=1";
              let "jesuiscompteur=jesuiscompteur+1";
          fi
          #################################++++++#############################
          if [[ ($FICHIER_URL == "thai.txt") || ($FICHIER_URL == "tibetain.txt") ]] #si c'est du thai
            then
              egrep -i "$motif" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt > ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt ;
              perl minigrep/minigrepmultilingue.pl "utf-8" ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt parametre-motif.txt;
              mv resultat-extraction.html ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.html ;
              comptagemotif=$(egrep -ico "$motif" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt);
              egrep -o "\w+" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt | sort | uniq -c | sort -r > ../DUMP-TEXT/index-$compteurdelangue-$jesuiscompteur.txt ;
              echo "<tr>
                  <th>$jesuiscompteur</th>
                  <th class='url'><a href='$element' target='_blank'>$element</a></th>
                  <th><a href='../PAGES-ASPIREES/$compteurdelangue-$jesuiscompteur.html' target='_blank'>$jesuiscompteur</a></th>
                  <th>$retourcurl</th>
                  <th>$encodage<br/>(detect-encodage)</th>
                  <th>-</th>
                  <th><a href='../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt' target='_blank'>dump-$jesuiscompteur</a></th>
                  <th><a href='../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt' target='_blank'>contexte-$jesuiscompteur</a></th>
                  <th><a href='../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.html' target='_blank'>contexte-$jesuiscompteur</a></th>
                  <th>$comptagemotif</th>
                  <th><a href='../DUMP-TEXT/index-$compteurdelangue-$jesuiscompteur.txt' target='_blank'>index-$jesuiscompteur</a></th>
                </tr>" >> $NOMDEFICHIER_COMPLEX
              echo "<file=$nbdump>" >> ../FICHIERGLOBAUX/CONTEXTES-GLOBAUX_$compteurdelangue.txt;
              echo "<file=$nbdump " >> ../FICHIERGLOBAUX/DUMP-GLOBAUX_$compteurdelangue.txt;
              cat ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt >> ../FICHIERGLOBAUX/CONTEXTES-GLOBAUX_$compteurdelangue.txt;
              cat ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt >> ../FICHIERGLOBAUX/DUMP-GLOBAUX_$compteurdelangue.txt;
              let "nbdump+=1";
              let "jesuiscompteur=jesuiscompteur+1";
          fi
          #################################++++++#############################
          else
            # LA PAGE ASPIREE N'EST PAS EN UTF8, ON VA COMMENCER PAR VERIFIER SI L'ENCODAGE EST CONNU DE ICONV
            VERIFENCODAGEDANSICONV=$(iconv -l | egrep -io $encodage | sort -u);
            if [[ $VERIFENCODAGEDANSICONV == "" ]];
              then
                # L'ENCODAGE N'EST PAS CONNU DE ICONV : ON VA CHERCHER UN CHARSET
                echo "L'ENCODAGE N'EST PAS CONNU DE ICONV : ON VA CHERCHER UN CHARSET";
                if egrep -qi "meta.+charset" ../PAGES-ASPIREES/$compteurdelangue-$jesuiscompteur.html ; 
                  then
                    # Y'A UN CHARSET, ON VA ESSAYER DE LE DETECTER...
                    echo "Y'A UN CHARSET, ON VA ESSAYER DE LE DETECTER...";
                    encodage=$(egrep -m 1 -o '(((utf|UTF)-(8|16|32))|(gb|GB)(k|K|2312|18030)|(iso|ISO|Iso)-8859-(\w)(\w)?|(WINDOWS|windows)-1252|(WINDOWS|windows)-1256|((m|M)(a|A)(c|C)(R|r)(O|o)(M|m)(a|A)(n|N))|us-ascii)' ../PAGES-ASPIREES/$compteurdelangue-$jesuiscompteur.html | tr "a-z" "A-Z" | sort -u) ;
                    echo "charset extrait : $encodage ";
                    # AVANT DE CONTINUER ON VA VÉRIFIER SI LE CHARSET EST CONNU DE ICONV
                    VERIFENCODAGEDANSICONV=$(iconv -l | egrep -io $encodage | sort -u);
                    if [[ $VERIFENCODAGEDANSICONV == "" ]]
                      then
                        # ENCODAGE NON CONNU DE ICONV... ON FAIT RIEN...
                        echo "ENCODAGE NON CONNU DE ICONV... ON FAIT RIEN...";
                        echo "encodage non connu de iconv... on fait rien...";
                        echo "<tr>
                            <th>$jesuiscompteur</th>
                            <th class='url'><a href='$element' target='_blank'>$element</a></th>
                            <th><a href='../PAGES-ASPIREES/$compteurdelangue-$jesuiscompteur.html' target='_blank'>$jesuiscompteur</a></th>
                            <th>$retourcurl</th>
                            <th>charset<br/>encodage<br/>non reconnus</th>
                            <th>-</th>
                            <th>-</th>
                            <th> - </th>
                            <th> - </th>
                            <th> - </th>
                            <th> - </th>
                        </tr>" >> $NOMDEFICHIER_COMPLEX;
                      let "jesuiscompteur = jesuiscompteur + 1";
                    else
                      echo "LE CHARSET EXTRAIT EST CONNU DE ICONV, ON LYNXE et ON ICONV...";
                      lynx -dump -nolist -assume_charset="$encodage" -display_charset="$encodage" $element  > ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur.txt ;
                      iconv -f $encodage -t utf-8 ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur.txt > ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt ;
                      if [[ ($FICHIER_URL == "anglais.txt") || ($FICHIER_URL == "francais.txt") || ($FICHIER_URL == "wolof.txt") ]] #si c'est du français, anglais et wolof
                        then
                        egrep -i "\b$motif\b" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt > ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt ;
                        perl ../PROGRAMMES/minigrep/minigrepmultilingue.pl "utf-8" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt parametre-motif.txt ;
                        mv resultat-extraction.html ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.html ;
                        comptagemotif=$(egrep -ioc "$motif" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt);
                        #VERSION HTML DU CONTEXTE AVEC MINIGREP
                        egrep -o "\w+" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt | sort | uniq -c | sort -r > ../DUMP-TEXT/index-$compteurdelangue-$jesuiscompteur.txt ;
                        echo "<tr>
                            <th>$jesuiscompteur</th>
                            <th class='url'><a href='$element' target='_blank'>$element</a></th>
                            <th><a href='../PAGES-ASPIREES/$compteurdelangue-$jesuiscompteur.html' target='_blank'>$jesuiscompteur</a></th>
                            <th>$retourcurl</th>
                            <th>$encodage<br/>(charset extrait)</th>
                            <th><a href='../DUMP-TEXT/$compteurdelangue-$jesuiscompteur.txt' target='_blank'>dump-$jesuiscompteur</a></th>
                            <th><a href='../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt' target='_blank'>dump-$jesuiscompteur</a></th>
                            <th><a href='../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt' target='_blank'>contexte-$jesuiscompteur</a></th>
                            <th><a href='../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.html' target='_blank'>contexte-$jesuiscompteur</a></th>
                            <th>$comptagemotif</th>
                            <th><a href='../DUMP-TEXT/index-$compteurdelangue-$jesuiscompteur.txt' target='_blank'>index-$jesuiscompteur</a></th>
                          </tr>" >> $NOMDEFICHIER_COMPLEX;
                        echo "<file=$nbdump>" >> ../FICHIERGLOBAUX/CONTEXTES-GLOBAUX_$compteurdelangue.txt ;
                        echo "<file=$nbdump>" >> ../FICHIERGLOBAUX/DUMP-GLOBAUX_$compteurdelangue.txt ;
                        cat ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt >> ../FICHIERGLOBAUX/CONTEXTES-GLOBAUX_$compteurdelangue.txt ;
                        cat ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt >> ../FICHIERGLOBAUX/DUMP-GLOBAUX_$compteurdelangue.txt ;
                        let "nbdump+=1";
                        let "jesuiscompteur = jesuiscompteur + 1";
                      fi
                      #####################+++++++#######################
                      if [[ ($FICHIER_URL == "thai.txt") || ($FICHIER_URL == "tibetain.txt") ]] #si c'est du thai
                        then
                        egrep -i "$motif" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt > ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt ;
                        perl ../PROGRAMMES/minigrep/minigrepmultilingue.pl "utf-8" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt parametre-motif.txt ;
                        mv resultat-extraction.html ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.html ;
                        comptagemotif=$(egrep -ioc "$motif" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt);
                        #VERSION HTML DU CONTEXTE AVEC MINIGREP
                        egrep -o "\w+" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt | sort | uniq -c | sort -r > ../DUMP-TEXT/index-$compteurdelangue-$jesuiscompteur.txt ;
                        echo "<tr>
                            <th>$jesuiscompteur</th>
                            <th class='url'><a href='$element' target='_blank'>$element</a></th>
                            <th><a href='../PAGES-ASPIREES/$compteurdelangue-$jesuiscompteur.html' target='_blank'>$jesuiscompteur</a></th>
                            <th>$retourcurl</th>
                            <th>$encodage<br/>(charset extrait)</th>
                            <th><a href='../DUMP-TEXT/$compteurdelangue-$jesuiscompteur.txt' target='_blank'>dump-$jesuiscompteur</a></th>
                            <th><a href='../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt' target='_blank'>dump-$jesuiscompteur</a></th>
                            <th><a href='../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt' target='_blank'>contexte-$jesuiscompteur</a></th>
                            <th><a href='../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.html' target='_blank'>contexte-$jesuiscompteur</a></th>
                            <th>$comptagemotif</th>
                            <th><a href='../DUMP-TEXT/index-$compteurdelangue-$jesuiscompteur.txt' target='_blank'>index-$jesuiscompteur</a></th>
                          </tr>" >> $NOMDEFICHIER_COMPLEX;
                        echo "<file=$nbdump>" >> ../FICHIERGLOBAUX/CONTEXTES-GLOBAUX_$compteurdelangue.txt ;
                        echo "<file=$nbdump>" >> ../FICHIERGLOBAUX/DUMP-GLOBAUX_$compteurdelangue.txt ;
                        cat ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt >> ../FICHIERGLOBAUX/CONTEXTES-GLOBAUX_$compteurdelangue.txt ;
                        cat ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt >> ../FICHIERGLOBAUX/DUMP-GLOBAUX_$compteurdelangue.txt;
                        let "nbdump+=1";
                        let "jesuiscompteur = jesuiscompteur + 1";
                      fi
                      #####################+++++++#######################
                  fi
                else
                  # PAS DE CHARSET, ON FAIT RIEN...
                  echo "PAS DE CHARSET, ON FAIT RIEN...";
                  echo "<tr>
                      <th>$jesuiscompteur</th>
                      <th class='url'><a href='$element' target='_blank'>$element</a></th>
                      <th><a href='../PAGES-ASPIREES/$compteurdelangue-$jesuiscompteur.html' target='_blank'>$jesuiscompteur</a></th>
                      <th>$retourcurl</th>
                      <th>pas de charset...</th>
                      <th>-</th>
                      <th>-</th>
                      <th> - </th>
                      <th> - </th>
                      <th> - </th>
                      <th> - </th>
                    </tr>" >> $NOMDEFICHIER_COMPLEX;
                  let "jesuiscompteur = jesuiscompteur + 1";
                fi
              else
                # L'ENCODAGE EST  CONNU DE ICONV : ON LYNX ET ON ICONV...
                echo "L'ENCODAGE EST  CONNU DE ICONV : ON LYNX ET ON ICONV...";
                lynx -dump -nolist -assume_charset="$encodage" -display_charset="$encodage" $element  > ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur.txt ;
                if [[ ($FICHIER_URL == "anglais.txt") || ($FICHIER_URL == "francais.txt") || ($FICHIER_URL == "wolof.txt") ]] #si c'est du français, anglais et wolof
                  then
                  iconv -f $encodage -t utf-8 ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur.txt > ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt;
                  egrep -i "\b$motif\b" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt > ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt ;
                  perl ../PROGRAMMES/minigrep/minigrepmultilingue.pl "utf-8" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt parametre-motif.txt ;
                  mv resultat-extraction.html ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.html ;
                  comptagemotif=$(egrep -ico "$motif" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt);
                  egrep -o "\w+" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt | sort | uniq -c | sort -r > ../DUMP-TEXT/index-$compteurdelangue-$jesuiscompteur.txt ;
                  echo "<tr>
                      <th>$jesuiscompteur</th>
                      <th class='url'><a href='$element'>$element</a></th>
                      <th><a href='../PAGES-ASPIREES/$compteurdelangue-$jesuiscompteur.html' target='_blank'>$jesuiscompteur</a></th>
                      <th>$retourcurl</th>
                      <th>$encodage<br/>(detect-encodage ; iconv OK)</th>
                      <th><a href='../DUMP-TEXT/$compteurdelangue-$jesuiscompteur.txt' target='_blank'>dump-$jesuiscompteur</a></th>
                      <th><a href='../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt' target='_blank'>dump-$jesuiscompteur</a></th>
                      <th><a href='../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt' target='_blank'>contexte-$jesuiscompteur</a></th>
                      <th><a href='../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.html' target='_blank'>contexte-$jesuiscompteur</a></th>
                      <th>$comptagemotif</th>
                      <th><a href='../DUMP-TEXT/index-$compteurdelangue-$jesuiscompteur.txt' target='_blank'>index-$jesuiscompteur</a></th>
                    </tr>" >> $NOMDEFICHIER_COMPLEX;
                  echo "<file=$nbdump>" >> ../FICHIERGLOBAUX/CONTEXTES-GLOBAUX_$compteurdelangue.txt ;
                  echo "<file=$nbdump>" >> ../FICHIERGLOBAUX/DUMP-GLOBAUX_$compteurdelangue.txt ;
                  cat ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt >> ../FICHIERGLOBAUX/CONTEXTES-GLOBAUX_$compteurdelangue.txt ;
                  cat ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt >> ../FICHIERGLOBAUX/DUMP-GLOBAUX_$compteurdelangue.txt ;
                  let "nbdump+=1";
                  let "jesuiscompteur = jesuiscompteur + 1";
                fi
                if [[ ($FICHIER_URL == "thai.txt") || ($FICHIER_URL == "tibetain.txt") ]] #si c'est du thai
                  then
                  iconv -f $encodage -t utf-8 ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur.txt > ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt;
                  egrep -i "$motif" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt > ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt ;
                  perl ../PROGRAMMES/minigrep/minigrepmultilingue.pl "utf-8" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt parametre-motif.txt ;
                  mv resultat-extraction.html ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.html ;
                  comptagemotif=$(egrep -ico "$motif" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt);
                  egrep -o "\w+" ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt | sort | uniq -c | sort -r > ../DUMP-TEXT/index-$compteurdelangue-$jesuiscompteur.txt ;
                  echo "<tr>
                      <th>$jesuiscompteur</th>
                      <th class='url'><a href='$element'>$element</a></th>
                      <th><a href='../PAGES-ASPIREES/$compteurdelangue-$jesuiscompteur.html' target='_blank'>$jesuiscompteur</a></th>
                      <th>$retourcurl</th>
                      <th>$encodage<br/>(detect-encodage ; iconv OK)</th>
                      <th><a href='../DUMP-TEXT/$compteurdelangue-$jesuiscompteur.txt' target='_blank'>dump-$jesuiscompteur</a></th>
                      <th><a href='../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt' target='_blank'>dump-$jesuiscompteur</a></th>
                      <th><a href='../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt' target='_blank'>contexte-$jesuiscompteur</a></th>
                      <th><a href='../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.html' target='_blank'>contexte-$jesuiscompteur</a></th>
                      <th>$comptagemotif</th>
                      <th><a href='../DUMP-TEXT/index-$compteurdelangue-$jesuiscompteur.txt' target='_blank'>index-$jesuiscompteur</a></th>
                    </tr>" >> $NOMDEFICHIER_COMPLEX;
                  echo "<file=$nbdump>" >> ../FICHIERGLOBAUX/CONTEXTES-GLOBAUX_$compteurdelangue.txt ;
                  echo "<file=$nbdump>" >> ../FICHIERGLOBAUX/DUMP-GLOBAUX_$compteurdelangue.txt ;
                  cat ../CONTEXTES/$compteurdelangue-$jesuiscompteur-utf8.txt >> ../FICHIERGLOBAUX/CONTEXTES-GLOBAUX_$compteurdelangue.txt ;
                  cat ../DUMP-TEXT/$compteurdelangue-$jesuiscompteur-utf8.txt >> ../FICHIERGLOBAUX/DUMP-GLOBAUX_$compteurdelangue.txt ;
                  let "nbdump+=1";
                  let "jesuiscompteur = jesuiscompteur + 1";
                fi
              fi
          fi
      else
        echo "PB sur l'aspiration, ON NE FAIT RIEN...";
        echo "<tr>
            <th>$jesuiscompteur</th>
            <th class='url'><a href='$element' target='_blank'>$element</a></th>
            <th> - </th>
            <th>$retourcurl</th>
            <th> - </th>
            <th> - </th>
            <th> - </th>
            <th> - </th>
            <th> - </th>
            <th> - </th>
            <th> - </th>      
          </tr>" >> $NOMDEFICHIER_COMPLEX;
        let "jesuiscompteur = jesuiscompteur + 1";
      fi
    done
  egrep -o "\w+" ../FICHIERGLOBAUX/DUMP-GLOBAUX_$compteurdelangue.txt | sort | uniq -c | sort -r > ../FICHIERGLOBAUX/index-dump-$compteurdelangue.txt ;
  egrep -o "\w+" ../FICHIERGLOBAUX/CONTEXTES-GLOBAUX_$compteurdelangue.txt | sort | uniq -c | sort -r > ../FICHIERGLOBAUX/index-contexte-$compteurdelangue.txt ;
  echo "
    <thead><tr>
      <th> </th>
      <th> </th>
      <th> </th>
      <th> </th>
      <th> </th>
      <th> </th>
      <th class='dump'><a href='../FICHIERGLOBAUX/DUMP-GLOBAUX_$compteurdelangue.txt'>Fichier DUMP<br/>global</a><br/><small>$nbdump fichier(s)</small></th>
      <th class='contextes'><a href='../FICHIERGLOBAUX/CONTEXTES-GLOBAUX_$compteurdelangue.txt'>Fichier CONTEXTES<br/>global</a><br/><small>$nbdump fichier(s)</small></th>
      <th> </th>
      <th> </th>
      <th> </th>
    </tr></thead>" >> $NOMDEFICHIER_COMPLEX;
  echo "</tbody></table>" >> $NOMDEFICHIER_COMPLEX;
  echo "</div>" >> $NOMDEFICHIER_COMPLEX;
  let "compteurdelangue = compteurdelangue + 1";
  #fin table1
done
echo "<hr/>" >> $NOMDEFICHIER_COMPLEX;
echo "</body>" >> $NOMDEFICHIER_COMPLEX;
echo "</html>" >> $NOMDEFICHIER_COMPLEX;